# PATENT ABSTRACTS OF JAPAN

(11)Publication number:

11-085615

(43)Date of publication of application: 30.03.1999

(51)Int.Cl.

G06F 12/08

G06F 15/163

G06F 15/173

(21)Application number: **09-243127** 

(71)Applicant: CANON INC

(22)Date of filing:

08.09.1997

(72)Inventor: SHIMOYAMA TOMOHIKO

# (54) SYSTEM AND DEVICE FOR PROCESSING INFORMATION AND CONTROL METHOD THEREFOR

## (57) Abstract:

PROBLEM TO BE SOLVED: To reduce the capacity of a storage mechanism for recording the destination to multicast access information required for providing a distributed shared memory.

SOLUTION: Nodes A and B for caching data provided by access to a shared memory space hold cache flags 152 and 252 showing whether their own memory spaces are cached in the other nodes or not for the unit of a cache. When the access to a memory in the present node is detected, the cache flag is referred to and when the relevant access address is cached by the other node, the multicast of the relevant access is requested to a concentrator 600. An ICC 630 of the concentrator 600 holds the cache of more detailed directory information and in the case of cache hit, the relevant access is reported to the node shown by this directory information.



(19)日本国特許庁 (JP)

# (12) 公開特許公報(A)

(11)特許出願公開番号

## 特開平11-85615

(43)公開日 平成11年(1999) 3月30日

| (51) Int.Cl. <sup>6</sup> |        | 識別記号  | FΙ   |       |         |
|---------------------------|--------|-------|------|-------|---------|
| G06F                      | 12/08  | 3 1 0 | G06F | 12/08 | 310B    |
|                           | 15/163 |       |      | 15/16 | 3 2 0 K |
|                           | 15/173 |       |      |       | 400N    |

審査請求 未請求 請求項の数14 OL (全 17 頁)

| (21)出願番号 | 特願平9-243127    | (71) 出顧人 000001007                    |
|----------|----------------|---------------------------------------|
| (22)出願日  | 平成9年(1997)9月8日 | キヤノン株式会社<br>東京都大田区下丸子3丁目30番2号         |
|          |                | (72)発明者 下山 朋彦<br>東京都大田区下丸子3丁目30番2号 キヤ |
|          |                | ノン株式会社内                               |
|          |                | (74)代理人 弁理士 大塚 康徳 (外2名)               |

## (54) 【発明の名称】 情報処理システム及び情報処理装置及びその制御方法

## (57)【要約】

【課題】分散共有メモリを実現する際に必要となるアクセス情報のマルチキャストの宛て先を記録するための記憶機構の容量を削減する。

【解決手段】共有メモリ空間へのアクセスによって得られたデータをキャッシングするノードA、Bは、自身のメモリ空間に関して他のノードにキャッシングされているか否かをキャッシュ単位で示すキャッシュフラグ152、252が保持されている。自ノード内のメモリに対するアクセスが検出されるとキャッシュフラグを参照し、当該アクセスアドレスが他ノードにキャッシングされている場合は、コンセントレータ600に当該アクセスのマルチキャストを要求する。コンセントレータ600「CC630にはより詳細なディレクトリ情報のキャッシュが保持されており、キャッシュヒットした場合は、このディレクトリ情報で示されるノードへ当該アクセスが通知される。



#### 【特許請求の範囲】

【請求項1】 複数の情報処理装置が通信可能に接続さ れ、相互に共有可能な共有メモリ空間を有する情報処理 システムであって、

前記共有メモリ空間へのアクセスによって得られたデー タをアクセス元の情報処理装置にてキャッシングするキ ャッシュ手段と、

前記複数の情報処理装置の各々が、自身のメモリ空間に 関して、他の情報処理装置にキャッシングされているか 否かをキャッシュ単位で示すキャッシュ情報を保持する 10 保持手段と、

前記保持手段によって保持されているキャッシュ情報に 基づいて前記キャッシュ手段のキャッシュメンテナンス を行うメンテナンス手段とを備えることを特徴とする情 報処理システム。

【請求項2】 前記メンテナンス手段は、

前記複数の情報処理装置の各々において、自身のメモリ 空間へのアクセスが発生した場合に、当該アクセス先ア ドレスが他の情報処理装置にキャッシングされているか 否かを前記キャッシュ情報を参照して判定する判定手段 20

前記判定手段によって前記アクセス先アドレスが他の情 報処理装置によってキャッシングされていると判定され た場合、当該アクセスをマルチキャストするマルチキャ スト手段とを備えることを特徴とする請求項1に記載の 情報処理システム。

【請求項3】 前記複数の情報処理装置の一つが、キャ ッシングアドレスとキャッシング先の情報処理装置を示 すマルチキャスト情報を保持する第2保持手段を備える 通信管理装置であり、

前記マルチキャスト手段による前記アクセスのマルチキ ャストは、前記第2保持手段に保持されたマルチキャス ト情報に基づいて選択された情報処理装置に対して行な われることを特徴とする請求項2に記載の情報処理シス テム。

【請求項4】 前記マルチキャスト手段は、前記判定手 段によって前記アクセス先アドレスが他の情報処理装置 によってキャッシングされていると判定され、前記第2 保持手段に対応する情報が保持されていない場合、当該 アクセスを前記複数の情報処理装置の全てにマルチキャ 40 ストするととを特徴とする請求項3に記載の情報処理シ ステム。

【請求項5】 前記複数の情報処理装置を接続する通信 網が、前記通信管理装置を中心としたスター結合である ことを特徴とする請求項3に記載の情報処理システム。

【請求項6】 前記複数の情報処理装置を接続する通信 網が、複数の波長の光を用いて接続する光波長多重化し た経路により構成されることを特徴とする請求項1乃至 5のいずれかに記載の情報処理システム。

れ、相互に共有可能な共有メモリ空間を有する情報処理 システムにおける情報処理装置であって、

前記共有メモリ空間へのアクセスによって得られたデー タをキャッシングするキャッシュ手段と、

自身のメモリ空間に関して、他の情報処理装置にキャッ シングされているか否かをキャッシュ単位で示すキャッ シュ情報を保持する保持手段と、

前記メモリ空間にアクセスが発生した場合、前記保持手 段によって保持されているキャッシュ情報に基づいて前 記キャッシュ手段のキャッシュメンテナンスを行うメン テナンス手段とを備えることを特徴とする情報処理装 置。

【請求項8】 前記メンテナンス手段は、

前記複数の情報処理装置の各々において、自身のメモリ 空間へのアクセスが発生した場合に、当該アクセス先ア ドレスが他の情報処理装置にキャッシングされているか 否かを前記キャッシュ情報を参照して判定する判定手段

前記判定手段によって前記アクセス先アドレスが他の情 報処理装置によってキャッシングされていると判定され た場合、当該アクセスのマルチキャストを要求する要求 手段とを備えることを特徴とする請求項7に記載の情報 処理装置。

【請求項9】 複数の情報処理装置が通信可能に接続さ れ、相互に共有可能な共有メモリ空間を有する情報処理 システムの制御方法であって、

前記共有メモリ空間へのアクセスによって得られたデー タをアクセス元の情報処理装置にてキャッシングするキ ャッシュ工程と、

前記複数の情報処理装置の各々が、自身のメモリ空間に 関して、他の情報処理装置にキャッシングされているか 否かをキャッシュ単位で示すキャッシュ情報を保持する 保持工程と、

前記保持工程によって保持されたキャッシュ情報に基づ いて前記キャッシュ工程のキャッシュメンテナンスを行 うメンテナンス工程とを備えることを特徴とする制御方

【請求項10】 前記メンテナンス工程は、

前記複数の情報処理装置の各々において、自身のメモリ 空間へのアクセスが発生した場合に、当該アクセス先ア ドレスが他の情報処理装置にキャッシングされているか 否かを前記キャッシュ情報を参照して判定する判定工程

前記判定工程によって前記アクセス先アドレスが他の情 報処理装置によってキャッシングされていると判定され た場合、当該アクセスをマルチキャストするマルチキャ スト工程とを備えることを特徴とする請求項9に記載の 制御方法。

【請求項11】 前記マルチキャスト工程は、前記判定 【請求項7】 複数の情報処理装置が通信可能に接続さ 50 工程によって前記アクセス先アドレスが他の情報処理装

置によってキャッシングされていると判定された場合、 当該アクセスを前記複数の情報処理装置の全てにマルチ キャストすることを特徴とする請求項9に記載の制御方 法。

【請求項12】 前記複数の情報処理装置の一つが、キ ャッシングアドレスとキャッシング先の情報処理装置を 示すマルチキャスト情報をメモリに保持する第2保持工 程を備える通信管理装置であり、

前記マルチキャスト工程による前記アクセスのマルチキ ャストは、前記第2保持工程によって前記メモリ保持さ 10 れたマルチキャスト情報に基づいて選択された情報処理 装置に対して行なわれることを特徴とする請求項11に 記載の制御方法。

【請求項13】 複数の情報処理装置が通信可能に接続 され、相互に共有可能な共有メモリ空間を有する情報処 理システムにおける情報処理装置の制御方法であって、 前記共有メモリ空間へのアクセスによって得られたデー タをキャッシングするキャッシュ工程と、

自身のメモリ空間に関して、他の情報処理装置にキャッ シングされているか否かをキャッシュ単位で示すキャッ シュ情報を保持する保持工程と、

前記メモリ空間にアクセスが発生した場合、前記保持工 程によって保持されているキャッシュ情報に基づいて前 記キャッシュ工程におけるキャッシュメンテナンスを行 うメンテナンス工程とを備えることを特徴とする制御方 法。

【請求項14】 複数の情報処理装置が通信可能に接続 され、相互に共有可能な共有メモリ空間を有する情報処 理システムに適用可能な情報処理装置のための制御プロ がコンピュータを、

前記共有メモリ空間へのアクセスによって得られたデー タをキャッシングするキャッシュ手段と、

自身のメモリ空間に関して、他の情報処理装置にキャッ シングされているか否かをキャッシュ単位で示すキャッ シュ情報を保持する保持手段と、

前記メモリ空間にアクセスが発生した場合、前記保持手 段によって保持されているキャッシュ情報に基づいて前 記キャッシュ手段のキャッシュメンテナンスを行うメン テナンス手段として機能させることを特徴とする記憶媒 40 体。

#### 【発明の詳細な説明】

[0001]

【発明の属する技術分野】本発明は分散共有メモリとそ の上でのキャッシュ機構を有する情報処理システム及び 情報処理装置及びその制御方法に関するものである。

[0002]

【従来の技術】分散共有メモリとその上でのキャッシュ 機構を有する情報処理システムが提案されている。一般 に、分散共有メモリを実現する場合、共有メモリの一貫 50 前記キャッシュ手段のキャッシュメンテナンスを行うメ

性保持のために必要な通信を必要な計算機にのみ配送す るため、あるアクセスに関しての情報をどの計算機に送 るかを記録する必要があった。例えばディレクトリ方式 の分散共有メモリのキャッシュシステムにおいては、メ モリのキャッシュライン毎にどの計算機にアクセス情報 をマルチキャストしなければならないかを記録してい る。

【0003】だがどの計算機にマルチキャストするかを 示す宛て先の保持に使用するメモリの容量は、通信機構 上 計算機の数により増大してゆき、その容量を押さえ るととが求められている。一般に、容量を押さえるため の手法として、宛て先の情報を欠落させ、不必要な計算 機にまでマルチキャストを行うことが行われることが多 かった。しかしながら、この手法では、記憶容量を節約 できる反面、不必要な計算機にマルチキャストを行うと とによる性能の低下が避けられなかった。

【0004】これを補う技術として、頻繁に使用される メモリアドレスについては詳しく宛て先を記録し、他の メモリアドレスに関しては宛て先の情報を欠落させる (特願平8-119268)、頻繁に使用しされるメモ リアドレスについては宛先を記録し他のメモリアドレス に関してはブロードキャストを行う(特願平8-310 22) といった手法が本出願人によって提案されてい る。

[0005]

20

【発明が解決しようとする課題】しかしながら、上記の ように宛て先をグループ化するなどしても、まだ大容量 の記憶機構が必要となる局面が生じたり、宛て先情報の 欠落をブロードキャストで補うことによる性能上の問題 グラムを格納する記憶媒体であって、該制御プログラム 30 が生じたりして、その実現が現実的でなくなる場合があ った。

> 【0006】本発明は、分散共有メモリを実現する際に 必要となるアクセス情報のマルチキャストの宛て先を記 録するための記憶機構の容量の削減と不要なマルチキャ ストによる性能低下とのバランスを向上させ、低コスト で高性能な情報処理システム及び情報処理装置及びその 制御方法を提供することを目的とする。

[0007]

【課題を解決するための手段】上記の目的を達成するた めの本発明の情報処理システムは以下の構成を備える。 すなわち、複数の情報処理装置が通信可能に接続され、 相互に共有可能な共有メモリ空間を有する情報処理シス テムであって、前記共有メモリ空間へのアクセスによっ て得られたデータをアクセス元の情報処理装置にてキャ ッシングするキャッシュ手段と、前記複数の情報処理装 置の各々が、自身のメモリ空間に関して、他の情報処理 装置にキャッシングされているか否かをキャッシュ単位 で示すキャッシュ情報を保持する保持手段と、前記保持 手段によって保持されているキャッシュ情報に基づいて ンテナンス手段とを備える。

【0008】また、上記の目的を達成するための本発明の情報処理装置は以下の構成を備える。すなわち、複数の情報処理装置が通信可能に接続され、相互に共有可能な共有メモリ空間を有する情報処理システムにおける情報処理装置であって、前記共有メモリ空間へのアクセスによって得られたデータをキャッシングするキャッシュ手段と、自身のメモリ空間に関して、他の情報処理装置にキャッシングされているか否かをキャッシュ単位で示すキャッシュ情報を保持する保持手段と、前記メモリ空10間にアクセスが発生した場合、前記保持手段によって保持されているキャッシュ情報に基づいて前記キャッシュ手段のキャッシュメンテナンスを行うメンテナンス手段とを備える。

【0009】また、上記の目的を達成するための本発明の情報処理システムの制御方法は以下の工程を備える。すなわち、複数の情報処理装置が通信可能に接続され、相互に共有可能な共有メモリ空間を有する情報処理システムの制御方法であって、前記共有メモリ空間へのアクセスによって得られたデータをアクセス元の情報処理装置と、前記複数の情報処理装置の各々が、自身のメモリ空間に関して、他の情報処理装置にキャッシングされているか否かをキャッシュ単位で示すキャッシュ情報を保持する保持工程と、前記保持工程によって保持されたキャッシュ情報に基づいて前記キャッシュ工程のキャッシュメンテナンスを行うメンテナンス工程とを備える。

【0010】また、上記の目的を達成する本発明の情報処理装置の制御方法は、複数の情報処理装置が通信可能に接続され、相互に共有可能な共有メモリ空間を有する情報処理システムにおける情報処理装置の制御方法であって、前記共有メモリ空間へのアクセスによって得られたデータをキャッシングするキャッシュ工程と、自身のメモリ空間に関して、他の情報処理装置にキャッシングされているか否かをキャッシュ単位で示すキャッシュ情報を保持する保持工程と、前記メモリ空間にアクセスが発生した場合、前記保持工程によって保持されているキャッシュ情報に基づいて前記キャッシュ工程におけるキャッシュメンテナンスを行うメンテナンス工程とを備える。

#### [0011]

【発明の実施の形態】以下、図面を参照して本発明の好 適な一実施形態を詳細に説明する。

【0012】<第1の実施形態>図1は、本実施形態の情報処理システムの採用する並列計算機システムの構成を示す図である。計算機は複数のノード(100,200,300,400,500)からなり、各々のノードはコンセントレータ600を通じて光ファイバによりネットワークを構成している。コンセントレータは、ノード間の通信を管理する。

[0013]各ノードは通常の計算機であり、各々1個または複数個のCPUを持つ。各々のノードはアドレス空間を共有している。図2は本実施形態によるメモリアドレス空間を説明する図である。図2に示されるように、一つのCPUからみえるアドレス空間には他のノードのアドレス空間が含まれる。なお、ノード間通信は、自分のアドレス上に見えている相手のメモリに対し、直接にデータを書き込むことで行う。

[0014]  $\sqrt{-1}$  (100, 200, 300, 40)0,500)は光通信装置(140,240,340, 440,540)を通じ、アービトレーション回線(1 60, 260, 360, 460, 560)、データ回線 (170, 270, 370, 470, 570)の2本の 光ファイバを介してコンセントレータ600に接続する ことによりネットワークを構成している。アービトレー ション回線(160, 260, 360, 460, 56 0) は、ノード (100, 200, 300, 400, 5 00) とコンセントレータ600内の光バスアービタ6 10を接続する。アービトレーション回線により、各ノ ードは光バスアービタ610と相互に通信することがで きる。データ回線(170,270,370,470, 570)は、ノードとコンセントレータ内のスターカブ ラ620を接続する。スターカプラ620は、一端に光 を入力すると他端からその光が均等に出力される。従っ て、一つのノードがデータ光線に光を発すると、その光 を他の全てのノードで受け取ることができる。この結 果、一つのノードがデータ回線に発した光通信を、全て のノードで受け取ることが可能となる。

【0015】ノードは、通信する波長を選択することに 30 より、任意のノードと通信を行う。例えば、ノードA1 00がノードB200と通信を行う場合は以下の手順が 実行される。まず、ノードA100がアービトレーション回線160を通じて光バスアービタ610にノードB200が他のノードと通信中でないことを確認すると、どのノードも使用していない波長αをノードA,B間(100,200間)の通信に割当てる。アービトレーション回線(160,260)を通じてノードA,B(100,200)に波長αを使用して通信 を行うように指示が出されると、ノードA,B(100,200)が波長αを使用してデータ回線(170,270)を通じて通信を行う。

【0016】分散共有メモリは、このようなネットワークの上で光通信により実現される。例としてノードA100のプロセッサ110(以下、CPU110)が、ノードB200のメモリ230をリードする様子を図3に示す。なお、 $(A1)\sim (A7)$ に示す動作は一連のものとして実施される。

[0017]図3において、

50 (A1) ノードA100のCPU110が、ノードBの

メモリ230に対してリードアクセスを発行する。

(A2) ノードA100の光通信装置140は、メインバス上のバスアクセスを監視している。メインバス上は、そのノードAのメモリ130以外のアドレスに対してアクセスが発行されると、光通信装置140はそのバスアクセスを検出する。

(A3)光通信装置140は、アクセス要求パケットを コンセントレータ600を通じて、ノードBの光通信装 置240に対して送る。

(A4) ノードBの光通信装置240はアクセス要求パ 10 ケットを受け取ると、その依頼にしたがってノードBの メモリ230に対してのアクセスを代行する。

(A5)ノードBのメモリ230がアクセスに応答す る。

(A6)ノードBの光通信装置240は、アクセスが終わると、ノードaの光通信装置140に対してアクノリッジを返す。

(A7) アクノリッジを受け取ったノードAの光通信装置140は、ノードBのメモリ(230)の代わりにノードAのCPU110のアクセスに応答する。

【0018】また本実施形態では、分散共有メモリ上で、ディレクトリ方式の一貫性保持方式を採用したキャッシュに類似したシステムを搭載している。ディレクトリ方式のキャッシュの詳細については、「共有記憶型並列システムの実際」(コロナ社刊)に示されている。【0019】通常のディレクトリ方式のキャッシュ一貫

【0019】通常のディレクトリ方式のキャッシュ一貫性保持機構では、メモリの各キャッシュアドレス毎に

(正確にはキャッシュ単位毎であるが、以下、これをキャッシュアドレス毎ということにする) そのアドレスをキャッシングしているノードを記録する。例えばノード 30 がA〜Hまであるとすれば、各キャッシュアドレス毎に 8 b i t のディレクトリを待つ。ディレクトリの各ピットは、ノードA〜Hに対応する。もしノードA、B、F、Hにそのアドレスがキャッシングされていれば、そのキャッシュアドレスに対応したディレクトリの値は2

進数で11000101となる。

【0020】本実施形態では上述の様なディレクトリ方式の代わりに、各キャッシュアドレス毎に1bitのフラグを持たせる。以降このフラグをキャッシングフラグと呼ぶ。キャッシングフラグは、そのキャッシュアドレ 40 スが他のノードにキャッシングされているかどうかを示す。例えばノードAのメモリ130内のアドレス18000の00がノードA、B、Hにキャッシングされていれば、アドレス180000に対応するキャッシングフラグはONとなる。キャッシュアドレス1800000がどのノードにもキャッシングされていないか、もしくはノードA自身のみにキャッシングされている場合には、キャッシュアドレス180000000に対応するキャッシングフラグはOFFになる。

【0021】ノード内のCPU間でのキャッシュの一貫 50 監視することで、アクセスを検出する。

8

性保持は、CPUに内蔵されたMESIプロトコル(Modified, Exclusive, Shared, Invalidの4状態によりキャッシュを管理するプロトコル)によるスヌーブキャッシュで管理されている(この実施形態ではMESIプロトコルを使用するが、これは本発明を限定するものではない)

【0022】さて、各ノード間のキャッシュの一貫性保持は、外付けされたキャッシュ管理装置(150、250、350、450、550)により管理される。キャッシュ管理装置は内部バス上でアクセスを検出すると、そのアクセスアドレスに対応したキャッシングフラグを参照し、もしキャッシングフラグがONになっていたらバス上に発行されたアクセス(キャッシュメンテナンス情報)を他のノードに伝達する。

【0023】実際のキャッシュメンテナンス情報のマル チキャストは、コンセントレータ600内の光バスアー ビタ610により行われる。光バスアービタ610は、 各ノードのキャッシュ管理装置からの要求によりアクセ スを各ノードに伝達する。光バスアービタ610には「 20 CC630と呼ばれるアクセスマルチキャスト情報のキ ャッシュがある。ICC630は最近使用されたアドレ スについて、そのアドレスへのアクセスをどのノードに 伝えるべきかを記録するキャッシュである。光バスアー ビタ610はアクセス要求を受け取ると、「CC630 を参照してそのアクセスを伝達すべきノードが記録され ていないかを調べる。もし記録されていたら(以下、「 CCヒットという)、光バスアービタ610はそれらの ノードにアクセスをマルチキャストする。もし記録され ていなければ(以下、ICCミスという)、全てのノー ドにアクセスをブロードキャストする。

[0024]以下、キャッシュ管理装置及び光バスアービタの構成について説明する。

【0025】図4はノードAにおけるキャッシュ管理装置150の構成を示すブロック図である。ノード間のキャッシュの一貫性保持をするキャッシュ管理装置150は、バス監視装置151、キャッシングフラグ152、キャッシュフラグ管理装置153、通信管理装置154、アクセスエミュレーション装置155を備える。以下にキャッシュ管理装置150の備える各装置について説明する。

【0026】図5は、バス監視装置151の構成を示すブロック図である。バス監視装置151の内部は、シーケンサ151aとアドレスラッチ151bからなっている。シーケンサ151aはノード内のバスを監視し、バスマスタ(例えばCPU110)によるメモリ130のリードアクセス、invalitate,Read-with-Intent-to-Modify、メモリ書込みの実行を検出する。シーケンサ151aは、バス上のアクセス要求信号、バスアクセスに伴ってバスマスタから出力されるアクセス修飾信号などを

【0027】バス監視装置151はアクセス要求信号が 有効であり、アクセスアドレスが自分のノードのメモリ に対するものであったとき、もしくは他ノードのメモリ へのキャッシュメンテナンスアクセスであったとき、ア クセスを検出したと判断する。アクセスが自ノードのメ モリに対するものであったとき、バス監視装置151は アクセスを検出するとメモリ130の応答を押さえ、そ の間にキャッシュフラグ管理装置153を通じてキャッ シングフラグ152を調べる。もし対応するキャッシン グフラグが〇Nなら、バス監視装置151は光バスアー 10 ビタ610にアクセスの伝達要求を出す。そしてそれら に対する応答により対象アドレスが他のノードにキャッ シングされているかどうかを知り、キャッシュフラグ管 理装置153を通じてキャッシュフラグ152を更新す る。その後バス監視装置151がメモリ130の応答を 許可することにより、CPU110はそのアクセスを完 了する。一方、他ノードのメモリへのキャッシュメンテ ナンスアクセスであったときは、CPU110のアクセ スをリトライさせておき、その間に光バスアービタ61 0 にアクセスの伝達要求を出す。そして、その完了パケ ットが届いたらCPU110のアクセスリトライを解除 し、処理を続行させる。

【0028】なお、上記メモリアクセスの中断は、バス 上にアクセス再実行信号を出力し、そのメモリアクセス をプロセッサにリトライさせることで実現したが、他の 方法によりアクセスを中断してもよい。

【0029】図6はキャッシュフラグ152及びキャッ シュフラグ管理装置の構成を説明するブロック図であ る。先に述べたように本実施形態は、メモリの各キャッ シュブロックに対して1bitのキャッシュフラグを持 30 対してブロードキャストを行う。 つ。キャッシングフラグは、そのアドレスが他のノード にキャッシングされているかどうかを示す。キャッシュ フラグ152への操作は、キャッシュフラグ管理装置1 53により行われる。キャッシュフラグ管理装置153 はシーケンサ153aにより管理されている。キャッシ ュフラグ152は、バス監視装置151が他ノードから のリード/ライトアクセスを検出した際に、対象メモリ ブロックが外部ノードにキャッシングされていることを 記録する場合にONにされ、バス管理装置151がメモ リ書込み/invalidata/Read-with-Intent-to-Modifyを 40 検出した場合、或いは対象メモリブロックが自ノードに のみキャッシングされている場合にはOFFにされる。 【0030】通信管理装置154はバス監視装置15 1、キャッシュフラグ管理装置153からの要求によ り、光通信装置140とのコミュニケーションを行う。 通信管理装置154は、バス監視装置151、キャッシ ュフラグ管理装置153からのリード/invalidata/Re ad-with-Intent-to-Modify/メモリ書込みのマルチキャ スト要求を受け、光通信装置140を介して光バスアー

ャストパケットを送出する。また光通信装置 140を通 じて受け取ったキャッシュの一貫性保持動作要求パケッ

トにより、メモリアクセスエミュレート装置155に対 してinvalidata/Read-with-Intent-to-Modify/ライト /リード要求を出力する。

【0031】図7はメモリアクセスエミュレート装置の 構成を示すブロック図である。メモリアクセスエミュレ ート装置155は、通信管理装置154からの要求によ り、ダミーのメモリライトアクセス/ダミーのメモリリ ードアクセス/invalidata/Read-with-Intent-to-Modi fyアクセスを自ノードのバス上に発行する。これらのア クセスにより、ノード間のキャッシュの一貫性を保持す る。エミュレート装置155の発行するアクセスは、自 分のノードに割り当てられたアドレスではありえないた め、ノード内のバススレーブ(例えばメモリ130)よ り応答はありえず、ダミーのアクセスとなる。

【0032】次に、コンセントレータ600について説 明する。図8はコンセントレータ600の構成を示すブ ロック図である。コンセントレータ600は、光バスア ービタ610、スターカプラ620、ICC630を備 える。光バスアービタ610は先に述べたように光回線 の通信制御を行う。またノードから送られてきたマルチ キャスト要求により、各ノードへのパケットの転送を行 う。また、ICC630はアクセスのマルチキャスト先 を保持するキャッシュメモリである。光バスアービタ6 10は、マルチキャスト対象アドレスがICC630に ヒット(ICCヒット)した場合にはICC630に記 録されたノードに対してマルチキャストを行う。ICC 630にミス(ICCミス)した場合は全てのノードに

【0033】ICC630を用いることにより、マルチ キャストの必要なノードを正確に知ることができるよう になり、不必要なブロードキャストがなくなる。とのた め、当該情報処理システムの性能を向上することができ る。図9はICC630のデータ構成を示す図である。 本実施形態ではICC630は図9のようなフルマップ (各ノードにつき1ビットを割り当てる) 方式をとって

【0034】なお、本実施形態では、光バスアービタ6 10は一つの計算機として実現するので、これらの機構 はソフトウェアで実現されるものとする。しかしなが ら、この構成例は本発明を制限するものではなく、ハー ドウェアで実現することも可能であることは明らかであ

【0035】以上の様な構成を備える本実施形態の動作 について以下に詳細に説明する。

【0036】図10はキャッシュ管理装置の動作を説明 するフローチャートである。まず、ステップS101に おいて、バス監視装置151がバスアクセスを検出する ビタ610に、アクセスのマルチキャスト/ブロードキ 50 とステップS102へ進む。ステップS102では、当 結果として光バスアービタ610に通知する(ステップ S153).

該アクセスが自ノード内のメモリに対するアクセスか否 かを判定する。そして、自ノード内のメモリへのアクセ スであった場合はステップS103へ、そうでない場合 はステップS111へそれぞれ進む。

【0037】ステップS103では、バス監視装置15 1がメモリ130の応答を抑制する。そして、キャッシ ュフラグ管理装置153を通してキャッシュフラグ15 2を参照し、当該キャッシュアドレスが他ノードにキャ ッシングされているか否かを判定する。他ノードへにキ 8へ進み、メモリ130に対する応答抑制を解除し、当 該アクセスを完了させる。

【0038】一方、ステップS104で当該キャッシュ アドレスが他ノードに対してキャッシングされていると 判定された場合は、他のノードに当該アクセスを通知す るためにステップS105へ進む。ステップS105で は、通信管理装置154に対して当該アクセスを通知す るべく指示を出す。通信管理装置154は光通信装置1 40を通じて、コンセントレータ600にマルチキャス ト要求を通知する。そして、コンセントレータ600よ りマルチキャスト完了パケット(マルチキャスト完了パ ケットには、当該キャッシュアドレスが他ノードへキャ ッシングされている否かを示す情報が含まれる) を受信 すると、このパケットに従ってキャッシュフラグ152 を更新する。

【0039】その後、ステップS108にて、メモリ1 30に対する応答抑制を解除し、当該アクセスを完了さ せる。また、ステップS102で自ノードのメモリでは ないと判定された場合は、ステップS111へ進み、当 該アクセスがキャッシュメンテナンスを含むか否かを判 30 定する。キャッシュメンテナンス情報を含まない場合 は、図3で説明した様な手順によって、光通信装置から アクセス要求パケットが発行されることになる。また、 キャッシュメンテナンスを含むアクセスであれば、ステ ップS112へ進み、メモリをリトライさせる。そし て、ステップS113において、対象メモリを有するノ ードに対してアクセス要求パケットを送出し、その応答 を待つ。そして、応答を得たならば、ステップS114 にてメモリのリトライを解除し、本アクセスを完了す る。なお、ステップS111~S114に関しても、キ 40 ャッシュ管理装置150内のバス管理装置151、通信 管理装置154が処理している。

【0040】図11は、光バスアービタよりパケットを 受信した場合の動作を説明するフローチャートである。 光バスアービタ610よりパケットを受信すると、アク セスエミュレーション装置155は当該パケットに従っ てバス上にアクセス情報を出力する(ステップS15 1、S152)。この結果、バスをスヌープしているC PU110、120やバス監視装置151が応答情報を 生成し、通信管理装置154がこの応答情報をアクセス 50

【0041】図12は、光バスアービタの動作手順を説 明するフローチャートである。図12では、キャッシュ メンテナンスに係るマルチキャスト(ブロードキャスト を含む) に対する応答動作が示されている。

[0042]ステップS201において、キャッシュア ドレスを含むマルチキャスト要求パケットを受信する と、ステップS202へ進み、当該キャッシュアドレス ャッシングされていなければ、そのままステップS10 10 でICC630を検索する。ICCミスした場合は、ス テップS203へ進み、全ノードに対してマルチキャス ト (ブロードキャスト)を行い、ステップS205へ進 む。一方、ステップS202においてICCヒットした 場合は、ステップS204へ進み、当該キャッシュアド レスに対応して記録されているノードに対してマルチキ ャストを行い、ステップS205へ進む。

【0043】ステップS205では、マルチキャスト先 の各ノードからの完了パケットを待つ。各ノードからの 完了パケットを受信したら、ステップS206へ進み、

受信した完了バケットに従ってICC630を更新す る。そして、ステップS207において、当該マルチキ ャスト要求もとのノードに対してマルチキャスト完了パ ケットを送出する。

【0044】次にキャッシュ管理装置150の動作を更 に具体的に説明する。すなわち、

・ノード内のアドレスにリード、invalidate、Read-wit h–Intent-to-Modify(キャッシュのライトミス時に出力 されるライトを前提としたリードサイクルであり、以下 RWITMとする) などのキャッシュメンテナンス情報 が出力されたとき、及び

・ノード外のアドレスに対してinvalidate、RWITM などのキャッシュメンテナンス情報が出力されたときに ついて具体的な動作を説明する。

【0045】図13は、ノード内のメモリに対してリー ド/ライト/invalidate/RWITM等のバスアクセス が発行された場合の動作を説明する図である。

(B1) ノード内のメモリ130に対してリードアクセ スが行われる。

(B2) バス監視装置151がそのアクセスを検知す

(B3) メモリ130へのアクセスを検知したバス監視 装置151は、メモリ130の応答を抑制する。

(B4) その間にバス監視装置151はキャッシュフラ グ管理装置153に、当該キャッシュアドレスに関する 参照要求を出す。

(B5) キャッシュフラグ管理装置153はキャッシュ フラグ152に指定されたキャッシュアドレスが他ノー ドにキャッシングされているか(対象アドレスに対応し たビットがONかOFFか)調べる。

(B6) もし対応するキャッシュフラグがONならば、

キャッシュフラグ管理装置153は通信管理装置154 を通じて発行されたリードアクセスを他のノードにマル チキャストするよう光バスアービタ610に要求を出 す

(B7) 光バスアービタ610はICC630を参照する。

(B8) ICCミスならば光バスアービタ610は全て のノードに当該リードアクセスをブロードキャストす る。

(B9) リードアクセスをブロードキャストされた各ノ 10 ード(200,300,400,500)は、バス上に リードアクセスを発行する。

(B10)各ノードのCPU(210,310,410,510)はこれをスヌープし、そのリードアクセスされたメモリ番地をキャッシングしているかどうかを返答する。

(B11)各ノードのバス監視装置(251,351,451,551)はこれを検出し、通信管理装置(254,354,454,554)を通じて、アクセスが完了したこととそのノードで該当アドレスがキャッシング 20しているかどうかを光バスアービタ610に伝える。

(B12) 各ノードからリードアクセスが完了したことを通知された光バスアービタ610は、各ノードがキャッシングしている/していないという情報をICC630にキャッシングし、ICC630を更新する。

(B13)他ノードに対象番地がキャッシングされているかどうかの情報を含んだアクセス完了パケットをノードA100に伝える。

(B14)通信管理装置154を通じて各ノードのキャッシング状況を受け取ったキャッシュフラグ管理装置153は、その内容をキャッシュフラグ152に記録する。

(B15) 記録が終了すると、バス監視装置151はメモリ130の応答抑制を解除し、当該リードアクセスが完了する。

【0046】もし(B8)においてICCヒットならば、光バスアービタ610は記録されたノードにアクセスをマルチキャストする。その後の動作は上記の物と同様である。

【0047】上記手順によれば、最初の1回目のアクセ 40 スは、アクセス情報を必要のないノードに対してもブロードキャストを生じさせる。しかし、必要のないノードに対してのブロードキャストは、システムの性能を落とすことにはなるが論理的な矛盾を生じさせるものではない。各ノードがブロードキャストに応答して返してくるパケットの中に、そのノードが該当アドレスをキャッシングしているかの情報が含まれているので、それに基づきキャッシュフラグをアップデートすることで、2回目以降のアクセスは必要なノードにのみマルチキャストが行われることになる。 50

14

【0048】また、ノード外のアドレスに対してリード /ライト/invalidata等のバスアクセスが出力された時 は、光通信装置を通じて他ノードにアクセスを依頼す る。アクセス先のノードのキャッシュ管理装置は、先に 述べたように光通信装置を通じて行われたアクセスに対 して応答する。

【0049】以上の様に、上記実施形態によれば、すべてのキャッシュアドレスについてそのアドレスが他の計算機にキャッシングされているかどうかを示すキャッシングフラグが記録され、他のノードにキャッシングされているアドレスに対してのメモリアクセスのみが他の計算機に伝達されることになる。このため、効率のよいマルチキャスト要求が実現されることになる。

[0050] なお、以上のような構成をとるのは、計算機外への伝達コストが比較的高いためである。計算機外に伝達が必要なアクセスが多発した場合には、システム全体としての性能を発揮することができない。そこで外部へのアクセスであるかどうを的確に判定し、計算機外への不要なアクセスを無くす或いは低減することでシステムの性能の向上が図られる。

[0051] <第2の実施形態>次に本発明の第2の実施形態を、図面を参照して説明する。

[0052]第1の実施形態ではICC630の構造を、フルマップ構造(ひとつのノードを1ビットで示す方法)で記録するようになっていた。このような場合、システムのノード数が多くなればICC630が必要とするメモリ容量も増加する。、また、メモリ容量の増大化を防止すれば、その分登録可能なキャッシングアドレスが減少してしまう。そこで第2の実施形態はICC630の構成を変更し、1つのキャッシングアドレスに関する記憶容量の削減を図る。

【0053】図14は、第2の実施形態におけるICC 630の構造を示す図である。ICC 630の各データレコードは、キャッシュタグ630a、ノードグループ 630b、マップ情報630cで構成される。キャッシュタグ630aはキャッシングアドレスを示す。ノードグループ630bには、ノードグループ内の先頭のノードが格納される。本例では、ノードグループ630bによって先頭のノードとして指定されたノードから順に6つのノードがノードグループとなる。例えば、ノードグループ630bにノードAが指定されていれば、ノードAからノードドがノードグループとして指定されたことになる。

【0054】ICC630の下位はマップ情報630cであり、これは、当該グループ内のノードについてのフルマップの情報である。例えば上位でノードSが示されていた場合、下位ではノードS~Xについてのフルマップの情報が示される。同様に上位でノードCが示されていた場合、下位ではノードC~Hがフルマップで示され

ている。ノードAとJが同時に同じ番地をキャッシング した場合はとのような形式では対応できないので、IC C630の上位を特別のバターン(例えば全て1)にし て、その番地に対するアクセスはブロードキャスト(全

てのノードに対して放送する)する。 【0055】以上の様に第2の実施形態によれば、グループ内で局所的なメモリ共有が行われている場合に、このような構成にすることでICC630の容量の削減を図ることができる。

·【0056】以上説明したように、上記各実施形態によ 10 れば、各ノードに大容量のディレクトリ(メモリ)を備えることなく、フルマップ法式を採用したディレクトリ方式に匹敵する高性能のキャッシュシステムを構築することができる。

[0057] なお、本発明は、複数の機器(例えばホストコンピュータ、インタフェイス機器、リーダ、ブリンタなど)から構成されるシステムに適用しても、一つの機器からなる装置(例えば、複写機、ファクシミリ装置など)に適用してもよい。

【0058】また、本発明の目的は、前述した実施形態 20 の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。

【0059】との場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成するととになる。

【0060】プログラムコードを供給するための記憶媒体としては、例えば、フロッピディスク、ハードディスク、光ディスク、光磁気ディスク、CD-ROM、CD-R、磁気テープ、不揮発性のメモリカード、ROMなどを用いるととができる。

【0061】また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部または全40部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。

【0062】さらに、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。

[0063]

【発明の効果】以上説明したように、本発明によれば、分散共有メモリを実現する際に必要となるアクセス情報のマルチキャストの宛て先を記録するための記憶機構の容量の削減と不要なマルチキャストによる性能低下とのバランスを向上させ、分散共有メモリシステムにおいて低コストで高性能なキャッシュシステムを提供できる。

【0064】 【図面の簡単な説明】

【図1】本実施形態の情報処理システムの採用する並列 計算機システムの構成を示す図である。

【図2】本実施形態によるメモリアドレス空間を説明する図である。

【図3】ノードA100のCPU110が、ノードB200のメモリ230をリードする様子を説明する図である。

【図4】ノードAにおけるキャッシュ管理装置150の 構成を示すブロック図である。

【図5】バス監視装置151の構成を示すブロック図である。

【図6】キャッシュフラグ152及びキャッシュフラグ 管理装置の構成を説明するブロック図である。

【図7】メモリアクセスエミュレート装置の構成を示す ブロック図である。

【図8】コンセントレータ600の構成を示すブロック図である。

【図9】【CC630のデータ構成を示す図である。

【図10】キャッシュ管理装置の動作を説明するフローチャートである。

30 【図11】光バスアービタよりパケットを受信した場合 の動作を説明するフローチャートである。

【図12】光バスアービタの動作手順を説明するフローチャートである。

【図13】ノード内のメモリに対してリード/ライト/invalidate/RWITM等のバスアクセスが発行された場合の動作を説明する図である。

[図14] 第2の実施形態におけるICC630の構造 を示す図である。

【符号の説明】

40 100, 200, 300, 400, 500 ノード

110, 120, 210, 220, 310, 320, 4 10, 420, 510, 520 CPU

130, 230, 330, 430, 530 メモリ

140, 240, 340, 440, 540 光通信装置 150, 250, 350, 450, 550 キャッシュ

管理装置

160, 260, 360, 460, 560 アービトレーション回線

170, 270, 370, 470, 570 データ回線

50 600 コンセントレータ

16

17

610 光バスアービタ

\* \*620 スターカプラ

【図2】 [図1] ビデオ RAM I/O他 自ノードのアドレス空間 メインRAM ff00 0000 ビデオ RAM ノードCのアドレス空間 1/0他 メインRAM 0200 0000 ビデオ RAM ノードBのアドレス空間 I/O他 メインRAM 0100 0000 ビデオ RAM ノードAのアドレス空間 I/O他 140 メインRAM 0000 0000

【図11】



【図4】



【図8】



[図7]





[図6]



【図10】



【図12】



【図13】



[図14]

